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Vorrichtung und Verfahren zur Zuordnung der NMR-Signale von Polypeptiden 



Die Erfindung betrifft ein Analysesystem zur automatisierten Analyse eines Satzes von NMR- 
Spektren, welcher fur eine n Aminosauren umfassende Polypeptidkette aufgezeichnet wurde 
sowie ein Verfahren zu automatisierten Analyse eines Satzes von NMR-Spektren. 

Die NMR-Spektroskopie hat sich in den vergangenen Jahren als Methode fur die Struktur- 
aufklarung von kleinen Proteinen und DNA-Fragmenten etabliert. Sie erlaubt die Untersu- 
chung von biologischen Makromolekulen in Losung — unter besonderer Berucksichtigung 
dynamischer Phanomene — und stellt damit eine zur Rontgenkristallographie komplementare 
Methode dar. 

Die NMR-spektroskopische Untersuchung von Proteinen blieb zunachst — mit wenigen Aus- 
nahmen — auf relativ kleine Vertreter mit einer GrdBe von bis zu 80 Aminosauren beschrankt, 
da sich fur groBere Proteine Signaluberlagerungen in den 2D-Spektren als limitierend erwie- 
sen. Erst die Einfuhrung von dreidimensionalen und vierdimensionalen NMR-Techniken 
(3D- und 4D-NMR) ermoglichte die Uberwindung dieser Barriere. In Verbindung mit einer 
Markierung der Proteine mit 2 H, 13 C und l5 N lassen sich heute Systeme mit einen Molekular- 
gewicht von bis zu 50 kD untersuchen. Die GroBe der noch untersuchbaren Proteine wird im 
wesentlichen durch die mit zunehmender Masse kiirzer werdende transversale Relaxationszeit 
bestimmt. 



Die Vielzahl der existierenden mehrdimensionalen NMR-Techniken werden im Rahmen von 
Strukturbestimmungsprojekten fiir zwei unterschiedliche Teilschtitte benotigt. In einem er- 
sten Schritt miissen alle *H, 13 C und 15 N-Signale eines Proteins zugeordnet werden. Bei die- 
sem Zuordnungsschritt muss zu diesen magnetisch aktiven Kernen im Protein das entspre- 
chende Signal im Spektrum gefunden werden. Fiir diese Aufgabe der Zuordnung gibt es spe- 
zielle Pulssequenzen. In dem Artikel „Protein Structure Determination with Three- and Four- 
Dimensional NMR Spectroscopy" von H. Oschkinat et al., Angew. Chem. Int. Ed. Engl. 
1994, 33, Seiten 277-293 wird ein Uberblick iiber die verschiedenen zur Proteinstrukturbe- 
stimmung verwendeten Experimente und Pulssequenzen gegeben. 

In dem Artikel „MUSIC, Selective Pulses, and Tuned Delays: Amino Acid Type-Selective *H- 
15 N Correlations, II" von M. Schubert et al., Journal of Magnetic Resonance 148, 2001, Seiten 
61-72 sind eine Anzahl von aminosauretyp-spezifischen ! H/ 15 N-Experimenten beschrieben, 
in denen unter Ausnutzung der Seitenkettentopologie die Signale eines bestimmten Typs von 
Aininosaure (z. B. Ser) oder einer bestimmten Gruppe von Aminosauren (z. B. Ile/Val) ent- 
halten sind. Die zur Durchfuhrung dieser aminosauretyp-spezifischen 2D-Experimente beno- 
tigten Pulssequenzen lassen sich auf einfache Weise aus den zur Bestimmung der Hauptket- 
tenstruktur verwendeten Tripelresonanz-Experimenten ableiten. 

Nachdem die Zuordnung vollstandig durchgefuhrt ist, konnen mit Hilfe anderer NMR- 
Techniken Strukturparameter des Proteins gesammelt werden. Dieser zweite Schritt baut auf 
der im ersten Schritt erhaltenen Zuordnung auf. Beispielsweise lassen sich mit Hilfe der ver- 
schiedenen mehrdimensionalen Versionen des NOESY-Experiments Abstande zwischen 
verschiedenen magnetisch aktiven Kernen ermitteln. Die so erhaltenen Stukturparameter 
dienen als EingangsgroCen fur StrukUirbestimmungs-Softwarepakete. Derartige Strukturbe- 
rechnungs-Programme erzeugen aus den zugefuhrten Strukturinformationen ein dreidimen- 
sionales Modell des Polypeptids. 

Gegenwartig werden die verschiedenen Schritte der Proteinstrukturanalyse mit semiautomati- 
schen Prozeduren und meist hauseigener Software in den verschiedenen NMR- 
Forschungsgruppen durchgefuhrt. Die vielen Versuche, insbesondere den Prozefi der Zuord- 
nung zu erleichtern, haben unter anderem zu sog. elektronischen Zeichentischen gefuhrt, in 
denen die Spektren auf dem Bildschirm dargestellt und mit vom Programm zur Verfugung 



gestellten Hilfsmitteln, wie automatischem Peakpicking und der Moglichkeit zur Spektren- 
iiberlagerung, zugeordnet werden. 

Viele Verfahren zur automatischen Zuordnung von NMR-Signalen basieren auf der Verwen- 
dung von Kreuzsignallisten, mit denen die Frequenzkoordinaten der Kreuzsignale erfasst 
werden. Diese Kreuzsignallisten lassen sich mit Hilfe von kombinatorischen Ansatzen aus- 
werten, die Vergleiche zwischen den in den Kreuzsignallisten enthaltenen Frequenzen vorse- 
hen. Wenn die Zuordnving mit Hilfe von Kreuzsignallisten vorgenommen wird, muss eine 
Reihe von Nachteilen in Kauf genommen werden. So treten bei Spektren mit niedrigem Si- 
gnal-Rausch-Verhaltnis oder starkem Tl-Rauschen spektrale Artefakte auf, welche uner- 
wiinschte zusatzliche Eintrage in die Kreuzsignallisten verursachen und eine erfolgreiche An- 
wendung der kombinatorischen Verfahren erschweren. Wenn die Kreuzsignale des Spek- 
trums sehr dicht liegen, konnen die einzelnen Kreuzsignale nicht mehr gegeneinander aufge- 
lost werden. In diesem Fall ergibt sich eine Kreuzsignalliste, in der verschiedene Eintrage 
fehlen oder verfalscht sind. 

y 

Aus diesen Griinden ist man von der Verwendung von Kreuzsignallisten abgekommen und 
versucht statt dessen, die in den NMR-Spektren enthaltenen Signalmuster mit Hilfe von al- 
temativen Verfahren zu erfassen. Ein derartiger Ansatz ist in dem Artikel „Tools for the au- 
tomated assignment of high-resolution three-dimensional protein NMR spectra based on 
pattern recognition techniques" von D. Croft et al., Journal of Biomolecular NMR, 10, 1997, 
Seiten 207-219 beschrieben. In diesem Artikel wird speziell auf die Signalmuster- 
Erkennungssoftware CATCH23 eingegangen. Diese Software verwendet Suchmasken zur 
Analyse der NMR-Spektren und fiihrt mit Hilfe einer Kombination von Suchmasken eine 
Mustersuche durch. Eine solche Kreuzsignalmuster-Suchmaske erfasst eine Vielzahl von 
Suchbereichen fur die zu erwartenden Kreuzsignale eines bestimmten Hauptketten- bzw. 
Seitenkettenfragments. Beispielsweise konnen mit einer Kreuzsignalmuster-Suchmaske samt* 
liche von der Aminosaure Threonin verursachten Kreuzsignale erfasst werden. Falls die 
Kreuzsignalmuster-Suchmaske die entsprechenden Peaks identifiziert, kann eine Zuordnung 
zwischen diesen Peaks und der Aminosaure Threonin vorgenommen werden. 

Haufig existieren jedoch mehrere Moglichkeiten, eine Zuordnung zwischen den Kreuzsigna- 
len einerseits und der Molekiilstruktur andererseits zu treffen. Diese Vieldeutigkeit bei der 
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Zuordnung macht oftmals ein manuelles Eingreifen erforderlich. Die in der publizierten Ver- 
sion der Software CATCH23 definierten Kreuzsignalmuster-Suchmasken ermoglicht noch 
keine hinreichende Stabilitat und Sicherheit fur eine vollautomatische Zuordnung der Signal- 
peaks. 

Es ist daher Aufgabe der Erfindung, eine Vorrichtung sowie ein Verfahren 2ur automatisier- 
ten Zuordnung der NMR-Signale eines Satzes von NMR-Spektren zur Verfiigung zu stellen, 
welche eine sichere und eindeutige Zuordnung der NMR-Signale zu den verschiedenen ma- 
gnetisch akriven Kernen ermoglicht und welche die Zahl der notwendigen manuellen Eingrif- 
fe verringert. 

% 

^jpiese Aufgabe der Erfindung wird durch ein Analysesystem zur automatisierten Analyse ei- 
nes Satzes von NMR-Spektren gemaB Anspruch 1 sowie durch ein Verfahren zur automati- 
sierten Analyse eines Satzes von NMR-Spektren gemaB Anspruch 18 gelosL 

Das erfindungsgemaBe Analysesystem dient zur automatisierten Analyse eines Satzes von 
NMR-Spektren, welcher fur eine n Aminosauren umfassende Polypeptidkette aufgezeichnet 
wurde, und umfasst eine Bibliothek von Kreuzsignalmuster-Suchmasken, wobei eine Kreuz- 
signalmuster-Suchmaske zur spezifischen Erfassung der NMR-Signale eines Fragments der 
untersuchten Polypeptidkette vorgesehen ist Es konnen dabei Kreuzsignale eines Fragments 
einer Aminosaure, oder von Fragmenten mehrerer sequentiell folgender, oder alle Kreuzsi- 
gnale einer oder mehrerer Aminosauren, die sequentiell in der Polypeptidkette verkmipft sind, 
erfasst werden. Die Fragmente konnen damit aus verbundenen Hauptkettenatomen, eventuell 
einschlieBlich der P-Kohlenstoffe, oder nur aus Seitenkettenatomen der einzelnen oder ver- 
kniipfter Aminosauren bestehen. Des weiteren umfasst das Analysesystem Mittel zur Auswahl 
der zur Analyse benotigten Kreuzsignalmuster-Suchmasken der Bibliothek entsprechend der 
Primarsequenz der Polypeptidkette, welche fur jedes in der Primarsequenz enthaltene Frag- 
ment die zugehorigen Kreuzsignalmuster-Suchmasken auswahlen. AuBerdem weist das Ana- 
lysesystem Mittel zur Mustererkennung auf, welche die verschiedenen Ergebnisse der ent- 
sprechend der Primarsequenz der Polypeptidkette ausgewahlten Kreuzsignalmuster- 
Suchmasken verbinden und mit dem Satz von NMR-Spektren korreheren. Dariiber hinaus 
umfaBt das Analysesystem Mittel zur Zuordnung der NMR-Signale zu den verschiedenen 
Spinsystemen der Polypeptidkette entsprechend dem Ergebnis der Mustererkennung. 
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Die erfindungsgemaBe Losung erlaubt insbesondere dann eine sehr zuverlassige Zuordnung, 
wenn fur ein Protein ein Satz von NMR-Spektren aufgezeichnet wird, der neben 3D- 
Experimenten zur Zuordnung der Haupt- und Seitenkettensignale auch aminosauretyp- 
5 spezifische 2D-Experimente enthalt. Diese aminosauretyp-spezifischen NMR-Experimente 
enthalten nur Kreuzsignale einer oder mehrerer Aminosauretypen, die entweder Korrelatio- 
nen zwischen Signalen von Atomen in der Proteinhauptkette oder von Seitenkettensignalen 
darstellen. 

10 Die erfindungsgemaBen Kreuzsignalmuster-Suchmasken sind so gestaltet, dass Signalmuster 
von Fragmenten, welche zu bestimmten Aminosauretypen oder Verknupfungen davon geho- 
ren, durch eine kombinierte Anwendung auf aminosauretyp-spezifische NMR-Experimente 
und 3D-Tripelresonanzexperimente erkannt werden konnen. Diese Erkennung der in den 
Fragmenten enthaltenen Signale bestimmter Aminosauretypen wird insbesondere dann er- 
15 folgreich sein, wenn diese zu Beginn der Suche in Form von zweidimensionalen Korrelatio- 
nen von Signalen der Proteinhauptkette, oder von Signalen der Seitenketten als Ausgangs- 
punkt verwendet werden. 

Mit den erfindungsgemaBen Kreuzsignalmuster-Suchmasken lassen sich damit insbesondere 
20 die Muster abfragen bzw. die Fragmente suchen, die von bestimmten Zweier- und Dreier- 

Kombinationen von Aminosauren, wie z.B. dem Paar Valin-Threonin hervorgerufen werden. 

Solche Kombinationen kommen in der Polypeptidkette nur einmal oder wenige Male vor, so 
^ dass sich eine dementsprechend kurze Trefferliste ergibt Diese hohe Selektivitat einer fur 

Zweier- bzw. Dreiergruppen von Aminosauren spezifischen Kreuzsignalmuster-Suchmaske 
25 ermoglicht in der iiberwiegenden Zahl der Falle eine eindeutige Zuordnung zwischen den 

erfassten Kreuzsignalen und dem zugehorigen Fragment der Polypeptidkette. Vieldeutigkei- 

ten bei der Zuordnung konnen so reduziert werden. 

Nachdem mit Hilfe der Kreuzsignalmuster-Suchmasken Zuordnungen zwischen den Kreuz- 
30 signalen und den verschiedenen gefiandenen Fragmenten andererseits vorgenommen wurden, 
miissen diese verschiedenen Teilzuordnungen in einem zweiten Schritt verbunden werden. 
Durch Verbinden der verschiedenen Teil-Zuordnungen gelangt man zu einer Zuordnung von 
alien Signalen des Spektrums zu den zugehorigen magnetisch aktiven Kernen der Polypeptid- 
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kette. Bei Verwendung der erfindungsgemaBen Kreuzsignalmuster-Suchmasken zur Erfas- 
sung von Fragmenten der untersuchten Polypeptidkette ergibt sich jeweils ein Uberlapp der 
verschiedenen auszuwertenden Fragmente. Fik die magnetisch aktiven Kerne im Uberlappbe- 
reich miissen die jeweils mit verschiedenen Kreuzsignalmuster-Suchmasken ermittelten che- 
5 mischen Verschiebungen iibereinstimmen. Mit Hilfe dieser Randbedingung lassen sich die 
verschiedenen Teil-Zuordnungen verbinden, wobei insbesondere auf die chemischen Ver- 
schiebungen von H N sowie N abgestellt wird. Wegen des Uberlapps zwischen den Kreuzsi- 
gnalmuster-Suchmasken lasst sich mit den erfindungsgemaBen Kreuzsignalmuster- 
Suchmasken die Verbindung der aus selektiven Suchen erhaltenen Teil-Zuordnungen zu einer 
10 Gesamt-Zuordnung wesentlich einfacher und sicherer bewerkstelligen, als dies im Stand der 
Technik moglich war. Die erfindungsgemaBen Kreuzsignalmuster-Suchmasken bieten inso- 
fem sowohl bei der eigentlichen Peakzuordnung als auch bei der nachfolgenden Verbindung 
der Teil-Zuordnungen Vorteile gegeniiber den einfachen Kreuzsignalmuster-Suchmasken des 
Stands der Technik. 

15 

Insgesamt wird durch den Einsatz der erfindungsgemaBen Kreuzsignalmuster-Suchmasken, 
mit denen sich die NMR-Signale eines Fragments der untersuchten Polypeptidkette spezifisch 
erfassen lassen, eine hohere Sicherheit bei der Zuordnung sowie eine bessere Erkennungsrate 
ermoglicht. Da die Zahl der bei der Zuordnung auftretenden Vieldeutigkeiten verringert wird, 

20 muss im Verlauf der Zuordnung weniger haufig manuell eingegriffen werden. Insofem stellt 
die Erfindung einen wichtigen Schritt beim Ubergang von der semiautomatischen zur vollau- 

^ tomatischen Zuordnung von NMR-Signalpeaks dar. Sobald eine verlassliche, vollautomati- 
^ sche Zuordnung moglich ist, lasst sich der Durchsatz bei der Bestimmung von Proteinstruk- 
turen signifikant erhohen. Ausserdem steigt die Verlasslichkeit der so erhaltenen Strukturda- 

25 ten an. 



Mit Hilfe der erfindungsgemaBen Kreuzsignalmuster-Suchmasken wird daruber hinaus eine 
geschickte und instruktive Kapselung der Analysetools fur die Zuordnung der Kreuzsignal- 
muster erreicht. Dadurch konnen die Ergebnisse der Zuordnung auch besser nachvollzogen 
30 werden. 



Es ist von Vorteil, wenn die Fragmente der untersuchten Polypeptidkette jeweils zwei bzw. 
drei bestimmte aufeinanderfolgende Aminosauren umfassen. Mit einer erfindungsgemaBen 
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Kreuzsignalmuster-Suchmaske kann ein bestimmtes Fragment von zwei (oder drei) Amino- 
sauren eindeutig anhand seiner NMR-Signale identifiziert werden. Mit den erfindungsgema- 
fien Kreuzsignalmuster-Suchmasken lassen sich damit insbesondere die Muster abfragen bzw. 
die Fragmente suchen, die von bestimmten Zweier- und Dreier-Kombinationen von Amino- 
5 sauren, wie z.B. dem Paar Valin-Threonin hervorgerufen werden. Solche Kombinationen 
kommen in der Polypeptidkette nur einmal oder wenige Male vor, so dass sich eine dement- 
sprechend kurze Trefferliste ergibt. Diese hohe Selektivitat einer fur Zweier- bzw. Dreier- 
gruppen von Aminosauren spezifischen Kreuzsignalmuster-Suchmaske ermoglicht in der 
iiberwiegenden Zahl der Falle eine eindeutige Zuordnung zwischen den erfassten Kreuzsigna- 
10 len und dem zugehorigen Fragment der Polypeptidkette. Vieldeutigkeiten bei der Zuordnung 
C*. konnen so reduziert werden. 

Es ist von Vorteil, wenn der Satz von NMR-Spektren sowohl NMR-Experimente zur Analyse 
der Hauptkettensignale als auch NMR-Experimente zur Analyse der Seitenkettensignale um- 
15 fasst. Die Verknupfung zwischen den Seitenketten und der Hauptkette wird insbesondere 

iiber die chemische Verschiebung der C a - sowie der Cp-Kerne hergestellt Mit Hilfe der erfin- 
dungsgemaBen Kreuzsignalmuster-Suchmasken, welche zur spezifischen Erfassung der 
NMR-Signale eines Fragments der untersuchten Polypeptidkette vorgesehen sind, konnen die 
Haupt- und Seitenkettensignale gemeinsam ausgewertet werden. 

20 

Es ist von Vorteil, wenn die zur Analyse der Hauptkettensignale verwendeten NMR- 
x Experimente 3D-Experimente, und insbesondere 3D-Experimente der Typen 
A* CBCA(CO)NNH, CBCANNH, HA(CO)NNH, HANNH, HAHB(CO)NNH, HAHBNNH, 

HN(CA)CO, HNCO, HN(CO)CA, HNCA umfassen. Bei den angefuhrten Experimenten 
25 handelt es sich urn 3D -Experimente, mit denen sich die chemischen Verschiebungen der ma- 

gnetisch aktiven Kerne der Hauptkette erfassen lassen. Die Vielfalt der verfugbaren 3D- 

Experimente erlaubt aber auch eine mehrfache Absicherung der Ergebnisse. 



30 



Es ist von Vorteil, wenn die zur Analyse der Seitenkettensignale verwendeten NMR- 
Experimente Experimente der Typen HCCH-COSY, HCCH-TOCSY, HCC(CO)NH- 
TOCSY umfassen. 
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Es ist von Vorteil, wenn die zur Analyse der Haupt- und Seitenkettensignale verwendeten 
NMR-Experimente aminosauretyp-spezifische ^/^N-Experimente umfassen, welche selek- 
tiv sind fur einen Aminosauretyp oder fur eine Gruppe von Aminosauretypen. Fiir ein Prote- 
in wird ein Satz von NMR-Spektren aufgezeichnet, der neben den 3D-Experimenten zur Er- 
fassung der Hauptkettenstruktur auch aminosauretyp-spezifische 2D-Experimente enthalt. 
Diese aminosauretyp-spezifischen NMR-Experimente enthalten nur Kreuzsignale einer oder 
mehrerer Aminosauretypen, die entweder Korrelationen zwischen Signalen von Atomen in 
der Proteinhauptkette oder von Seitenkettensignalen darstellen. Aminosauretyp-spezifische 
2D-Experimente ermoglichen die selektive Anregung der Seitenketten eines Aminosauretyps 
bzw. einer Gruppe von Aminosauretypen. AnschlieBend wird die Magnetisierung iiber die 
Seitenkette zu den Hauptketten-Stickstoffen und Amidprotonen transferiert Mit Hilfe von 
aminosauretyp-spezifischen ^/^N-Experimenten lassen sich die von einem bestimmten 
Aminosauretyp bzw. einer Gruppe von Aminosauretypen verursachten NMR-Signale, die 
eine Art „Fingerabdruck" eines bestimmten Aminosauretyps bzw. einer Gruppe von Amino- 
sauren darstellen, hochspezifisch erfassen. Mit einer erfindungsgemaBen Kreuzsignalmuster- 
Suchmaske konnen dann gezielt die NMR-Signale eines Fragments der untersuchten Polypep- 
tidkette abgefragt werden. Dadurch wird eine hohere Sicherheit bei der Zuordnung sowie 
eine bessere Erkennungsrate ermoglicht 

Die zur Durchfuhrung der aminosauretyp-spezifischen 2D-Experimente benotigten Pulsse- 
quenzen lassen sich auf einfache Weise aus den vor allem zur Bestimmung der Hauptketten- 
struktur verwendeten Tripekesonanz-Experimenten ableiten. 

Es ist von Vorteil, wenn die zur Analyse der Haupt- und Seitenkettensignale erforderlichen 
aminosauretyp-spezifischen 2D-Experimente entsprechend der Primarsequenz der Polypep- 
tidkette festgelegt werden. Diese Primarsequenz ist vorher bekannt. Die zur Durchfuhrung 
der NMR-Messungen erforderliche Menge an Protein wird namlich unter Zuhilfenahme einer 
entsprechenden DNS-Sequenz mit Hilfe von biotechnologischen Methoden erzeugt. Wenn 
nun beispielsweise in der Primarsequenz der Polypeptidkette die Aminosaure Cystein nicht 
vorkommt, so ist es auch nicht notwendig, das aminosauretyp-spezifische 2D-Experiment fiir 
Cystein durchzufiihren. Anhand der Primarsequenz lasst sich also der minimal erforderliche 
Datensatz fiir die NMR-Experimente fesdegen. 



Es ist von Vorteil, wenn die zur Analyse der Haupt- und Seitenkettensignale verwendeten 
NMR-Experimente eine Kombination von 2D- und 3D-Experimenten umfassen. Die kom- 
binierte Verwendung von Hauptkettenexperimenten und aminosauretyp-spezifischen 2D- 
Experimented zusammen mit die Auswertung der NMR-Signale mit Hilfe von Kreuzsignal- 
muster-Suchmasken, ermoglicht eine erhebliche Performancesteigerung bei der automatisier- 
ten Auswertung von NMR-Spektren. Die erfindungsgemaBen Kreuzsignalmuster- 
Suchmasken sind so gestaltet, dass Signalmuster von Fragmenten, welche zu bestimmten 
Aminosauretypen oder Verkniipfungen davon gehoren, durch eine kombinierte Anwendung 
auf aminosauretyp-spezifische NMR-Experimente und 3D-Tripelresonanzexperimente er- 
kannt werden konnen. Da insbesondere mit Hilfe von aminosauretyp-spezifischen 2D- 
Experimenten die Zahl der bei der Zuordnung auftretenden Vieldeutdgkeiten vertingert wer- 
den kann, muss im Verlauf der Zuordnung weniger haufig manuell eingegriffen werden. Die 
Erfindung stellt daher einen wichtigen Schritt beim Ubergang von der semiautomatischen zur 
vollautomatischen Auswertung von NMR-Spektren dar. 

GemaB einer vorteilhaften Ausfiihrungsform der Erfindung werden ausgehend von der Zu- 
ordnung der NMR-Signale zu den verschiedenen Spinsystemen der Polypeptidkette die che- 
mischen Verschiebungen zusammengefasst und auf ihre Richtigkeit uberpriift Ausgehend 
von der Zuordnung der NMR-Signale konnen beispielsweise die fur die verschiedenen ma- 
gnetisch aktiven Kerne einer Aminosaure ermittelten chemischen Verschiebungen in Form 
eines Vektors zusammengefasst werden. Hinsichtlich der Hauptkette kann dann insbesondere 
mittels der chemischen Verschiebung von H N und N, welche in verschiedenen Experimenten 
unabhangig voneinander ermittelt werden, eine Konsistenzuberprufung durchgefuhrt werden. 
Fiir die in verschiedenen Experimenten ermittelten chemischen Verschiebungen miissen sich 
ubereinstimmende bzw. nahe beieinander liegende Werte ergeben. Entsprechend erlauben die 
chemischen Verschiebungen der Kerne C a und Cp, welche sowohl in Hauptkettenexperimen- 
ten als auch in Seitenkettenexperimenten ermittelt werden, eine derartige Konsistenzuberpru- 
fung fur die Haupt- und Seitenketten. 

GemaB einer weiteren Ausfiihrungsform der Erfindung umfasst der Satz von NMR-Spektren 
Spektren des Typs NOESY, deren Auswertung insbesondere Informationen iiber die Ab- 
stande der verschiedenen Kerne der Polypeptidkette voneinander liefert. In Experimenten 
des Typs NOESY wird die durch den Kern-Overhauser-Effekt verursachte Kreuzrelaxation 
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erfasst Aus den Amplituden der NOE-Kreuzsignale lassen sich Riickschliisse auf die Ab- 
stande zwischen den beteiligten Kernen ziehen. Fur die Ermittlung der Proteinstruktur sind 
Spektren des Typs NOESY daher von besonderer Bedeutung. 

GemaB einer weiteren Ausfuhrungsfotm der Erfindung erfolgt die Zuordnung der NMR- 
Spektren des Typs NOESY zu den verschiedenen Kemen der Polypeptidkette anhand der fiir 
die Kerne ermittelten chemischen Verschiebungen. Die Zuordnung der Kreuzsignale in den 
NOESY-Spektren zu den verschiedenen magnetisch aktiven Kernen wird insbesondere an- 
hand der protonenchemischen Verschiebungen vorgenommen. Aber auch wenn die proto- 
nenchemischen Verschiebungen mit zufriedenstellender Genauigkeit vorab bestimmt wurden 
und daher vorbekannt sind, bleiben wegen der Mehrfachbedeutung der einzelnen Kreuzsigna- 
le noch Vieldeutigkeiten bestehen. Aus diesem Grund ist es urn so wichtiger, anhand von 
moglichst genau erfassten protonenchemischen Verschiebungen einen moglichst grofien An- 
teil der NOESY-Spektren eindeutig zuordnen zu konnen. 

GemaB einer weiteren vorteilhaften Ausfuhrungsform der Erfindung dienen die bei der Aus- 
wertung der NMR-Spektren erhaltenen GroBen als EingangsgroBen fur Strukturberechnungs- 
Software. Wichtige EingangsgroBen fiir S trukturb erechnxings -Programme sind vor allem die 
aus den zugeordneten NOESY-Spektren erhaltenen Kernabstande. Dem Strukturberech- 
nungs-Programm kann hierzu eine Liste der Amplituden der NOE-Kreuzsignale und der 
Frequenzkoordinaten der Peaks sowie die Resonanzzuordnving iibergeben werden. Weitere 
EingangsgroBen konnen die Kopplungskonstanten zwischen verschiedenen Kemen sein, 
denn aus diesen Kopplungskonstanten lassen sich die Diederwinkel zwischen verschiedenen 
Kernen ermitteln. 

Es ist von Vorteil, wenn die Kreuzsignalmuster-Suchmasken jeweils eine Anzahl von vordefi- 
nierten Signalsuchbereichen umfassen, wobei durch das Auftreten von NMR-Signalen inner- 
halb der Bereichsgrenzen eines Signalsuchbereichs die Wahrscheinlichkeit erhoht wird, dass 
das durch die Kreuzsignalmuster-Suchmaske definierte Signalmuster vorliegt. Auf diese Weise 
lasst sich das zu suchende Peakmuster exakt mittels einer Anzahl von Suchbereichen definie- 
ren. Dadurch wird eine echte Mustererkennung moglich. Jeder innerhalb der Grenzen eines 
Suchbereichs auftretende Signalpeak erhoht die Bewertungszahl fur die Kreuzsignalmuster- 
Suchmaske. Dabei ist es insbesondere von Vorteil, dass auch bei Fehlen einzelner Peaks des 
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Signalmusters ein Signalmuster noch erkannt werden kann, wean es ansonsten hinreichend 
gut mit der Kreuzsignalmuster-Suchmaske ubereinstimmt Bei der Bewertung, ob ein Peak- 
muster mit der Kreuzsignalmuster-Suchmaske ubereinstimmt, kommt es auf die insgesamt 
festgestellten Ubereinstimmungen an. 

Dabei ist es von Vorteil, wenn die Kreuzsignalmuster-Suchmasken jeweils eine Anzahl von 
vordefinierten Leerbereichen umfassen, wobei durch das Fehlen von NMR-Signalen inner- 
halb der Bereichsgrenzen eines Leerbereichs die Wahrscheinlichkeit erhoht wird, dass das 
durch die Kreuzsignalmuster-Suchmaske definierte Signalmuster vorliegt. Die Definition von 
Leerbereichen ist beispielsweise dann sinnvoll, wenn zwei verschiedene Seitenkettenstruktu- 
ren zu zwei einander ahnlichen Signalmus tern fuhren, wobei das zweite Signalmuster einige 
zusatzliche Peaks aufweist, welche im ersten Signalmuster nicht enthalten sind. Das Fehlen 
dieser Signalpeaks ist dann genau das typische an dem ersten Signalmuster, so dass es sich zur 
Erfassung des ersten Signalmusters empfiehlt, an den entsprechenden Stellen Leerbereiche zu 
definieren. Wenn dann innerhalb der Grenzen der Leerbereiche keine Peaks auftreten, so 
wird die Bewertungszahl fur das Vorliegen des ersten Signalmusters erhoht. Durch die Defi- 
nition von Leerbereichen konnen die beiden Signalmuster deshalb besser unterschieden wer- 
den. 

Es ist von Vorteil, wenn ausgehend von der erwarteten Anzahl der NMR-Signale in den 
Spektren durch Iteration die Schwellwerte und Suchbereiche fur die Kreuz signalmus ter- 
Suchmasken ermittelt werden. Bei dieser Vorgehensweise werden die Suchbereiche anfangs 
durch weit gesteckte Grenzen definiert, wahrend die Schwellwerte relativ niedrig gewahlt 
werden. Die Auswertung der beim ersten Durchlauf aufgefundenen Signalpeaks Uefert erste 
Aussagen daruber, welches bzw. welche Kreuzsignalmuster voraussichtlich vorliegen. In einer 
zweiten, modifizierten Suche kann dann speziell nach diesen wahrscheinlichsten Kandidaten 
gesucht werden, dabei konnen die Suchbereiche in Abhangigkeit von den chemischen Ver- 
schiebungen der bei der ersten Suche aufgefundenen Peaks verkleinert bzw. verschoben wer- 
den, urn die Suche zu verfeinern. AuBerdem ist es moglich, bei der zweiten Suche mit erhoh- 
ten Schwellwerten zu arbeiten. Mit Hilfe dieser iterativen Vorgehensweise lasst sich erreichen, 
dass die Kreuzsignalmuster-Suche schrittweise in Richtung des tatsachlich vorliegenden 
Kreuzsignalmusters konvergiert. 
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GemaB einer weiteren vorteilhaften Ausfuhrungsform der Erfindung vimfasst die Kreuzsi- 
gnalmuster-Suchmaske eine Vielzahl von Unter-Suchmasken zur Analyse der verschiedenen 
NMR-Spektren des aufgezeichneten Satzes von NMR-Spektren. Die eigenliche Kreuzsignal- 
muster-Suchmaske ergibt sich insofetn als Gesamtheit verschiedener Unter-Suchmasken, 
welche jeweils verschiedene zwei-, drei- oder hoherdimensionale Spektren absuchen. Der Satz 
von NMR-Spektren wird also mit einem entsprechenden Satz von Unter-Suchmasken analy- 
siert. Dies hat insbesondere den Vorteil, dass sich die Modifikation von Suchbereichsgrenzen 
simultan auf alle Unter-Suchmasken auswirkt. Dadurch wird die Handhabung des Satzes von 
Suchmasken vereinfacht 

Bei dem erfindungsgemaBen Verfahren zur automatisierten Analyse eines Satzes von NMR- 
Spektren, welcher fur eine n Aminosauren umfassende Polypeptidkette aufgezeichnet wurde, 
werden zunachst die zur Analyse benotdgten Kreuzsignalmuster-Suchmasken aus einer Biblio- 
thek von Kreuzsignalmuster-Suchmasken ausgewahlt, wobei eine Kreuzsignalmuster- 
Suchmaske zur spezifischen Erfassung der NMR-Signale eines Fragments der untersuchten 
Polypeptidkette vorgesehen ist, und wobei das Auswahlen der benotigten Kreuzsignalmuster- 
Suchmasken entsprechend den in der Primarsequenz enthaltenen Fragmenten erfolgt. An- 
schlieBend wird eine Mustererkennung durchgefuhrt, indem die verschiedenen ausgewahlten 
Kreuzsignalmuster-Suchmasken mit dem Satz von NMR-Spektren korreliert werden. Ent- 
sprechend dem Ergebnis dieser Mustererkennung werden die NMR-Signale zu den verschie- 
denen Spinsystemen der Polypeptidkette zugeordnet 

Da die erfindungsgemaBen Kreuzsignalmuster-Suchmasken jeweils samtliche NMR-Signale 
eines Fragments der untersuchten Polypeptidkette zusammen auswerten, konnen mit dem 
erfindungsgemaBen Verfahren die NMR-Signale eines Fragments, insbesondere eines zwei 
bzw. drei Aminosauren umfassenden Fragments, hochselektiv erfasst werden. Wenn dann fur 
die einzelnen Fragmente der Polypeptidkette verlassliche Signalzuordnungen vorliegen, kann 
wegen des Uberlapps zwischen den Analyseergebnissen eine Gesamtzuordnung der NMR- 
Signale der Polypeptidkette hergeleitet werden. Gegeniiber den Verfahren des Stands der 
Technik wird die Eindeutigkeit und Sicherheit der Zuordnungen verbessert Manuelle Ein- 
griffe des Benutzers sind weniger haufig erforderlich und deshalb eignet sich das Verfahren 
insbesondere zur vollautomatischen Auswertung von NMR-Spektren. Dadurch kann der 
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Zeit- und Geldbedarf bei der Ermitdung von Ptoteinstrukturen durch NMR-Spektroskopie 
weiter abgesenkt werden. 

Nachfolgend wird die Erfindung anhand eines in der Zeichnung daxgestellten Ausfuhrungs- 
beispiels weiter beschrieben. Es zeigen: 

Fig. 1 einen Ablaufplan for die Aufzeichnung der benotigten NMR-Spektren; 

Fig. 2 eine Tabelle, aus der die in der Aminosauresequenz enthaltenen Paare von 

Aminosauren ausgelesen werden konnen; 

Fig. 3 eine Reihe von Beispielen fur aminosauretyp-spezifische 2D-Experimente, mit 

denen gezielt das Vorliegen oder Nichtvorliegen bestimmter Seitenketten- 
strukturen abgefragt werden kann; 

Fig. 4 eine Kxeuzsignalmuster-Suchmaske, mit der die in den Spektren enthaltenen 

Signalmuster erkannt und ausgewertet werden konnen; sowie 

Fig. 5A, 

Fig. 5B einen Ablaufplan fiir die Auswertung der aufgezeichneten NMR-Spektren, 

wobei eine Zuordnung zwischen den auftretenden Signalpeaks und den Spin- 
systemen des Proteins hergestellt wird. 

In Fig. 1 ist der Ablauf bei der Aufzeichnung der benotigten NMR-Spektren dargestellt Aus- 
gangspunkt fur die Fesdegung der erforderlichen Experimente ist die Primarstruktur des Pro- 
teins. Meist werden die benotigten Proteine mit Hilfe von biotechnologischen Methoden un- 
ter Zuhilfenahme von entsprechenden DNS-Abschnitten synthetisiert, da sich auf diese Wei- 
se die benotigten Proteinmengen einfach herstellen lassen. Es ist daher im folgenden davon 
auszugehen, dass die Primarstruktur des Proteins vorbekannt ist, und dass die NMR- 
spektroskopischen Experimente lediglich zur Strukturermitdung des Proteins eingesetzt wer- 
den sollen. 
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Im Schritt 1 werden die in der Primarsequenz enthaltenen Paare von aufeinanderfolgenden 
Aminosauren ermittelt und aufgelistet Da die Primarstruktur bekannt ist, kann dies auf sehr 
einfache Weise von einem selbstgeschriebenen Computerprogramm namens „selma" durch- 
gefuhrt werden. In Fig. 2 ist das von dem Programm „selma" fur das Protein OPR gelieferte 
5 Ergebnis dargestellt Die entlang der x- und der y-Achse aufgetragenen Buchstaben bezeich- 
nen jeweils die 20 moglichen Aminosauren. Die entlang der y-Achse aufgelisteten Aminosau- 
ren bezeichnen die in der ersten Position des betrachtenen Aminosaure-Paars vorkommende 
Aminosaure, wahrend die entlang der x-Achse aufgelisteten Aminosauren die Aminosaure an 
der zweiten Stelle des Aminosaure-Paars bezeichnen. 

10 

f In der sich ergebenden Matrix sind die verschiedenen in der Aminosauresequenz des Proteins 

OPR auftretenden Aminosaure-Paare eingetragen. Der Tabelle kann entnommen werden, 
dass das Aminosaure-Paar AE genau einmal in der Sequenz vorkommt, wahrend das Amino- 
saure-Paar EA nicht in der Sequenz enthalten ist. Falls die Ziffer 2 oder 3 an einer bestimm- 
15 ten Matrixposition eingetragen ist, so bedeutet dies, dass das entsprechende Aminosaure-Paar 
in der Sequenz mehrfach auftrittt. Dies ist z.B. beim Aminosaure-Paar ED der Fall. 

Die so erhaltenen Informationen uber die in der Primarsequenz enthaltenen Aminosaure- 
Paare dienen im Schritt 2 zur Fesdegung eines Satzes von NMR-Experimenten, welche zur 
20 Ermitdung der Proteinstruktur durchgefiihrt werden miissen. Das Ziel ist, moglichst keine 
uberflussigen Experimente durchzufuhren, welche nur unnotig die Messzeit verlangern wiir- 
den. So lasst sich beispielsweise anhand der in Fig. 2 gezeigten Ergebnisse des Programms 




„selma" erkennen, dass die Aminosaure Cystein im Protein OPR nicht vorkommt. Die Auf- 



zeichnung eines Cystein-selektiven 2D-Experiments ist nicht notwendig, und das Cystein- 
25 selektive 2D-Experiment wird daher auch nicht Bestandteil des in Schritt 2 festgelegten Sat- 
zes von NMR-Experimenten. 

In Schritt 3 werden die zwei- bzw mehrdimensionalen NMR-Spektren des Satzes in einem 
NMR-Spektrometer aufgezeichnet Das Spektrometer umfasst eine Spektrometersteuerung, 
30 welche anfangs die Betriebsparameter des Spektrometers, wie beispielsweise die Protonentra- 
gerfrequenz sowie die Lange von 90°-Pulsen ermittelt und einstellt. AnschlieBend werden die 
in Schritt 2 festgelegten Spektren der Reihe nach aufgezeichnet. Hierzu enthalt die Spektro- 
metersteuerung eine Auswahl an standardisierten NMR-Pulssequenzen. 
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Die Aufzeichnung der fvir ein Protein benotdgten NMR-Spektren erfotdert eine Messzeit von 
einigen Wochen. Danach stehen die aufgezeichneten Spektren als Dateien eines Projektord- 
ners 4 zur Verfugung und konnen im Schritt 5 weiter ausgewertet werden. Als Ergebnis erhalt 
man 2D-Spektren „2rr" sowie 3D-Spektren „3rrr". Aus den im Projektordner 4 enthaltenen 
Dateien ermittelt das Progtamm „gnat" verschiedene fur die weitere Auswertung benotigte 
statistische Parameter 6, die beispielsweise fur die Festlegung von Schwellwerten benotigt 
werden. Mit Hilfe derartiger Schwellwerte konnen die in den Spektren enthaltenen Peaks vom 
Untergrundrauschen unterschieden werden. 

Zur Erfassung der chemischen Verschiebungen der magnetisch aktiven Kerne der Hauptkette 
werden typischerweise 3D-Tripelresonanzexperimente sowie aminosauretyp-spezifische 2D- 
Experimente verwendet, mit denen sich insbesondere auch die Resonanzen von l3 C und 15 N- 
Kernen erfassen lassen. Hierzu dienen insbesondere folgende Paare von 3D-Experimenten: 
CBCA(CO)NNH und CBCANNH, HA(CO)NNH und HANNH, HAHB(CO)NNH und 
HAHBNNH, HN(CA)CO und HNCO sowie HN(CO)CA und HNCA. In Klammern ange- 
gebene Kerne (z.B. 3D-HN(CO)CA) werden nicht detektiert, sind aber bei einem Koharenz T 
transfer involviert. 

Zur Ermitdung der benotigten chemischen Verschiebungen wurde bereits die Durchfiihrung 
einer geringen Zahl von Tripelresonanzexperimenten ausreichen. Um verlaBliche Ergebnisse 
zu erzielen, ist es allerdings von Vorteil, die verschiedenen im Protein auftretenden Korrela- 
tionen jeweils durch mehrere Experimente zu erfassen, so dass die Ergebnisse auf ihre Konsi- 
stenz uberpriift werden konnen. 

Mit Hilfe des Experiments CACBNNH erhalt man die Frequenzen der Kerne H N , N, C a und 
Cp der i-ten Aminosaure sowie die Frequenzen der Kerne C a und Cp der Aminosaure i-1. Das 
CAGB(CO)NH-Spektrum enthalt die Korrelationen der Kerne H N und N der Aminosaure i 
mit den Kernen C a und Cp der Aminosaure i-1 . 



Mit dem 3D-Experiment des Typs HNCA werden die Frequenzen der Kerne N, H N und C a 
der i-ten Aminosaure erfasst. Entsprechend konnen mittels des Experiments HNCA auch die 



16 

Frequenzen der Kerne N, H N sowie C a der Aminosaure i+1 erfasst werden. Mit dem Expe- 
riment HNCA ist es dariiber hinaus auch moglich, den Kern C a der Aminosaure i mit den 
Kernen N und H N der Aminosaxire i+1 zu korrelieren. 

Der wesentliche Vorteil der Tripelresonanzexperimente ist die verhaltnismafiig geringe An- 
zahl von Signalpeaks in den Spektren. Tripelresonanzexperimente enthalten pro Aminosaure 
nur ein oder maximal zwei Kreuzsignale. Dadurch wird eine weitgehende Automatisierung 
der Auswertung moglich. 

Die frequenzspezfische Zuordnung erfolgt somit dutch die Kombination einzelner „Baustei- 
ne", welche sich in Teilen iiberschneiden. Besonders wichtig sind solche Experimente, die 
eine Erfassung der chemischen Verschiebungen der P-Kohlenstoffe erlauben. 

Als besonders vorteilhaft fiir die Aufklarung der Resonanzzuordnung hat sich die Verwen- 
dung der Pulssequenz MUSIC (Multiplicity Selective In-Phase Coherence Transfer) erwiesen. 
MUSIC-Pulssequenzen zur gezielten Anregung der Seitenketten einer Gruppe von Amino- 
sauren bzw. eines bestimmten Aminosauretyps konnen durch Abwandlung der Pulssequen- 
zen von 3D-Tripekesonanzexperimenten (wie beispielsweise CBCA(CO)NNH ) erhalten 
werden. 

In Fig. 3 ist der jeweilige Magnerisierungstransfer fur eine Reihe von aminosauretyp- 
spezifischen 2D-Experimenten dargestellt. Zunachst wird eine bestimmte in der Seitenkette 
befindliche Gruppe durch die MUSIC-Sequenz angeregt. Bei den gezeigten Beispielen wird 
jeweils die durch eine rechteckige Umrandung hervorgehobene CH 2 - bzw. CH 3 -Gruppe ange- 
regt. Von dort wird die Magnetisierung entlang der Seitenkette zu dem C a -Atom und von 
dort weiter zum Amidproton N trans feriert. Der Unterschied zwischen den in der linken und 
in der rechten Spake gezeigten Experimenten besteht in der Art des Transfers von dem Ca- 
Atom zu dem Stickstoff N. Bei den in der linken Spalte gezeigten Experimenten gelangt die 
Magnetisierung von dem C a -Kern zu der Carbonylgruppe und von dort weiter zum Stickstoff 
N und zum Amidproton H N der Aminosaure i+1. Wegen dieses Magnetisierungstransfers zur 
nachstfolgenden Aminosaure werden diese Experimente als (i+l)-HSQCs bezeichnet. Bei 
den in der rechten Spalte gezeigten (i, i+l)-HSQCs dagegen gelangt die Magnetisierung von 
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dem C a -Kern aus entweder zutn Sticks toff N derselben Aminosaure i oder zum Sticks toff N 
der benachbarten Aminosaure i+1. Mit Hilfe der in Fig. 3 gezeigten Experimente lassen sich 
2D-Spektren selektiv fur einen bestimmten Typ von Aminosaure (z. B. fur Set, 1. Zeile; Leu, 
3. Zeile) oder selektiv fur bestimmte Gruppen von Aminosauren (vgl. Ile/Val, 2. Zeile; 
Asp/Asn, 4. Zeile sowie Glu/Gln, 5. Zeile) erfassen. 

Die aufgezeichneten 2D- sowie 3D-Spektren werden anschlieBend einer Mustererkennung 
unterzogen, urn die in den Spektren auftretenden Signalpeaks den einzelnen Spinsystemen des 
Proteins zuordnen zu konnen. Bei den Losungen des Stands der Technik wurde diese Zuord- 
nung meist mit Hilfe von Peaksignallisten vorgenommen. Gegeniiber derartigen Losungsan- 
satzen bietet die Verwendung von Mustererkennungs-Routinen insofern Vorteile, als hier die 
gemessenen Kreuzsignalmuster in ihrer Gesamtheit beurteilt werden konnen. 

In Fig. 4 ist eine zur Analyse von Kreuzsignalmustern verwendete Kr euz signalmus ter- 
Suchmaske dargestellt An den Positionen 8, 10, 12 sowie den hierzu spiegelbildlichen Posi- 
tionen 14, 16 und 18 des zweidimensionalen Spektrums werden Signalpeaks erwartet. Urn die 
erwarteten Peakpositionen herum sind rechteckige Signalsuchbereiche 9, 11, 13 sowie 15, 17, 
19 definiert. Innerhalb der so definierten Bereiche auftretende Signalpeaks werden von der 
Mustererkennungs-Software erfasst, wahrend auBerhalb der Signalsuchbereiche auftretende 
Peaks nicht erfasst werden. Die Kreuzsignalmuster-Suchmaske umfasst also die vordefinier- 
ten Signalsuchbereichen 9, 1 1, 13, 15, 17, 19, wobei die Software innerhalb dieser Signalsuch- 
bereiche nach den erwarteten Signalpeaks sucht. 

Der Ablauf der Mustererkennung und Zuordnung ist in den Fig. 5A und 5B dargestellt Zur 
Analyse der Kreuzsignalmuster dient eine Bibliothek 19 von erfindungsgemaBen Kreuzsi- 
gnalmuster-Suchmasken, welche der Mustererkennungssoftware 20 zur Verfugung steht. Mit 
jeder der erfindungsgemaBen Kreuzsignalmuster-Suchmasken lassen sich die Signalpeaks ei- 
nes Fragments von zwei (oder drei) aufeinanderfolgenden Aminosauren erfassen und zuord- 
nen. Die Auswahl der fur die Mustererkennung benotigten Kreuzsignalmuster-Suchmasken 
erfolgt dabei entsprechend der durch das Programm „selma" vorgenommenen Zerlegung der 
Aminosauresequenz in Zweierfragmente. Die zur Zuordnung der Signalpeaks des Proteins 
benotigten Kreuzsignalmuster-Suchmasken werden entsprechend den in der Primarsequenz 
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enthaltenen Zweiergruppen aus der Bibliothek 19 ausgewahlt und det Mustererkennungs- 
Software 20 zur Verfugung gestellt 

Mit Hilfe einer vordefinierten Kreuzsignalmuster-Suchmaske lassen sich samtliche Signal- 
peaks, die von einer Zweiergruppe von aufeinanderfolgend angeordneten Aminosauren ver- 
ursacht werden, also sowohl die von dem beiden Seitenketten verursachten Signalpeaks als 
auch die vom Hauptkettenfragment verursachten Signalpeaks, gemeinsam auswerten. 

Es soil im folgenden davon ausgegangen werden, dass zur Zuordnung der Hauptkettensignale 
drei verschiedene Paare von Tripekesonanzexperimente, namlich die Paare 
CBCANNH/ CBCA(CO)NNH, HNCO/HN(CA)CO sowie HANNH/HA(CO)NNH, und 
die aminosauretyp-spezifischen 2D-Experimente herangezogen werden. In diesem Fall ent- 
halt die Bibliothek 19 von Kreuzsignalmuster-Suchmasken insgesamt 3 x 20 x 20 = 3 x 400 = 
1200 verschiedene Kreuzsignalmuster-Suchmasken, namlich 

• 400 Kreuzsignalmuster-Suchmasken zur Analyse von: 

CBCANNH + CBCA(CO)NNH + zwei aminosauretyp-spezifische 2D-Experimente, 

• 400 Kreuzsignalmuster-Suchmasken zur Analyse von: 

HNCO + HN(CA)CO + zwei aminosauretyp-spezifische 2D-Experimente, sowie 

• 400 Kreuzsignalmuster-Suchmasken zur Analyse von: 

,HANNH + HA(CO)NNH + zwei aminosauretyp-spezifische 2D-Experimente. 

Jede der erfindungsgemaBen Kreuzsignalmuster-Suchmasken dient zur Auswertung von zwei 
aminosauretyp-spezifischen 2D-Experimenten sowie von einem Paar von 3D- 
Tripelresonanzexperimenten. Um die verschiedenen Spektren mit einer Kreuzsignalmuster- 
Suchmaske auswerten zu konnen, umfasst die Kreuzsignalmuster-Suchmaske einen Satz von 
Unter-Suchmasken, wobei mit jeder Unter-Suchmaske ein bestimmter Typ von Spektren aus- 
gewertet werden kann. Programmtechnisch prasentiert sich die Kreuzsignalmuster- 
Suchmaske jedoch als eine Einheit. Es ist daher moglich fur die gesamte Kreuzsignalmuster- 
Suchmaske mit all ihren Unter-Suchmasken einen bestimmten Auswertungsparameter, bei- 
spielsweise eine Suchbereichsgrenze, zu verandern. Die Veranderung wirkt sich dann in 
selbstkonsistenter Art und Weise auf die Suchbereichsgrenzen in samtlichen Unter- 
Suchmasken aus. 
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Die in der Bibliothek 19 enthaltenen, vordefinierten Kreuzsignalmuster-Suchmasken legen 
den Suchalgorithmus fur das Auffinden bestimmter Signalmuster fest Allerdings sind die 
Kreuzsignalmuster-Suchmasken in parameterunabhangiger Form niedergelegt Die benotigten 
Suchbereichsgrenzen 22 sowie die zur Unterscheidung der Signalpeaks vom Rauschunter- 
grund benotigten Schwellwerte 23 werden den Kreuzsignalmuster-Suchmasken extern zur 
Verfugung gestellt. 

Diese Vorgehensweise bietet die Moglichkeit, die bei der Durchfuhrung einer Kreuzsignal- 
mustersuche verwendeten Parameter und Suchbereiche im Laufe der Suche zu verandern und 
an neu gewonnene Informationen anzupassen. Insbesondere ist es von Vorteil, die Suchbe- 
reichsgrenzen anfangs sehr breit zu wahlen und in Abhangigkeit von den innerhalb der Such- 
bereiche auftretenden Peaks iterativ zu verkleinem, um so das gesuchte Kreuzsignalmuster 
mit hoherer Sicherheit erfassen zu konnen. Entsprechend konnen die Schwellwerte 23 von 
einem anfangs niedrigen Wert im Laufe der Suche auf immer hohere Werte angehoben wer- 
den, um so die Kreuzsignalmuster mit den hochsten Bewertungszahlen herauszufiltern. 

Die im folgenden aufgefuhrten Programmroutine stellt eine Implementierung einer Kreuzsi- 
gnalmuster-Suchmaske dar, welche die zwei seitenkettenspezfischen 2D-Experimente 
„sHSQCcoN" sowie „sHSQCcaS" sowie das Paar von 3D-Tripelresonanzexperimenten 
„HNcoCACB" sowie „HNCACB" auswertet Diese fiir ein Paar von Aminosauren spezifi- 
sche Kreuzsignalmuster-Suchmaske umfasst also vier Unter-Suchmasken zur Auswertung der 
verschiedenen 2D- sowie 3D-Spektren. Die Verbindung der durch Auswertung der verschie- 
denen Spektren gefundenen Ergebnisse erfolgt durch die chemischen Verschiebungen der 
Kerne im Uberlappbereich, also insbesondere uber die chemischen Verschiebungen von H N , 
N, C a und Cp. 

( Appendix 1 ) 

Aus dem Programmcode ist insbesondere erkennbar, dass die Kreuzsignalmuster-Suchmaske 
in ihrer abstrakt festgelegten Form noch keine numerisch festgelegten Suchbereiche und 
Schwellwerte aufweist. Die entsprechenden Variablen „submatrix_sizes", j^weep^widths", 
„ppm_offsets" sowie „nucleus_species" sind lediglich in abstrakter Form definiert. 
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Das folgende Programmlisting zeigt die Kreuzsignalmuster-Suchmaske fur die 2D-Spektren 
„sHSQCcoN", „sHSQCcaS" sowie der 3D-Spektren „HNcoCACB", „HNCACB", wobei 
inzwischen die Suchbereichsgrenzen 22 sowie die Schwellwerte 23 bereitgestellt wurden: 

( Appendix 2 ) 

Insbesondere hinsichtlich der Parameter ,,matrix_sizes", ,,submattix_sizes", „sweep_widths", 
„ppm_offsets", „nucleus_species" sowie „mask__lower_threshold" ist nun jeweils der numeri- 
sche Wertebereich festgelegt. 

Sobald die Suchbereichsgrenzen 22 sowie die Schwellwerte 23 festgelegt sind, kann die Mu- 
stererkennungs-Software 20 mit der eigentlichen Mustererkennung beginnen. Hierzu werden 
die aufgezeichneten 2D-Spektren „2rr" sowie die 3D-Spektren „3rrr" mit den Suchbereichen 
der Kreuzsignalmuster-Suchmaske (bzwr einer ihrer Unter-Suchmasken) korreliert, urn eine 
Bewertungszahl fur das Vorliegen des durch die Kreuzsignalmuster-Suchmaske erfassten 
Kreuzsignalmusters zu erhalten. 

Bei dem in Fig. 4 gezeigten Beispiel werden die Werte des Spektrums, die innerhalb der Si- 
gnalsuchbereiche 9, 11, 13, 15, 17, 19 liegen, aufsummiert, urn so die Bewertungszahl fur das 
Vorliegen des Kreuzsignalmusters zu erhalten. Wenn die erwarteten Signalpeaks innerhalb der 
Signalsuchbereiche 9, 11, 13, 15, 17, 19 auftreten, dann ergibt sich eine hohe Bewertungszahl 
fur das gesuchte Kreuzsignalmuster. Dies bedeutet, dass das gesuchte Kreuzsignalmuster mit 
hoher Wahrscheinlichkeit vorliegt. Wenn die erwarteten Peaks in den Signalsuchbereichen 9, 
11, 13, 15, 17, 19 dagegen ganz oder teilweise fehlen, dann ergibt sich eine dementsprechend 
niedrige Bewertungszahl. In diesem Fall ist es unwahrscheinlich, dass das gesuchte Kreuzsi- 
gnalmuster vorliegt. 

Zur Berechnung der Bewertungszahl wird ein sog. Masken-Scan 24 durchgefuhrt, bei dem die 
Koordinaten der chemischen Verschiebung in den verschiedenen Raumrichtungen nachein- 
ander hochgezahlt werden, um so das gesamte Spektrum abzurastern. Der so erzeugte Koor- 
dinatenwert wird mit den Maskendaten 25 verglichen. Wenn der Koordinatenwert auBerhalb 
von samtlichen Signalsuchbereichen der Kreuzsignalmuster-Suchmasken liegt, so bleibt die 
Bewertungszahl unverandert. Wenn der neu generierte Koordinatenwert dagegen innerhalb 
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eines Suchbereichs liegt, so wird der zu diesem Koordinatenwert gehorige Spektxenwert zu 
der Bewertungszahl addiert. Mit Hilfe eines derartigen Masken-Scans 24 lasst sich die Bewer- 
tungszahl fur eine bestimmte Kreuzsignalmuster-Suchmaske bzw. fur eine bestimmte Unter- 
Suchmaske der Kreuzsignalmuster-Suchmaske schnell und einfach ermitteln. 

Bisher war davon ausgegangen worden, dass die Kreuzsignalmuster-Suchmaske lediglich eine 
Anzahl von Signalsuchbereichen umfasst, wobei innerhalb der Suchbereichsgrenzen das Auf- 
treten von Signalpeaks erwartet wird. Entsprechend konnen aber auch Leerbereiche definiert 
werden, wobei das Auftreten eines Signalpeaks innerhalb der Leerbereichs-Grenzen zu einer 
Verringerung der Bewertungszahl fuhrt. Derartdge Leerbereiche stellen also gewissermaBen 
„verbotene" Bereiche dar, in denen keine Signalpeaks auftreten durfen. 

Zur Verbesserung der Erkennungsgenauigkeit kann versucht werden, die Qualitat der 2D- 
bzw. 3D-Spektren vor der Durchfuhrung der Mustererkehnung mittels einer Faltungsoperati- 
on zu verbessern. Hierzu kann ein ideales GauB-Signal, dessen GroBe und Ausdehnung in 
etwa der GroBe und Ausdehnung der erwarteten NMR-Signalpeaks entspricht, mit dem Spek- 
trum gefaltet werden. Auf diese Weise konnen Artefakte unterdruckt und verschmierte Peaks 
besser aufgelost werden. 

In Fig. 5A ist dargestellt, dass die Auswertung von zwei aminosauretyp-spezifischen 2D- 
Spektren sowie von einem Paar von Tripelresonanzexperimenten vier Teilergebnisse 26, 27, 
28, 29 liefert. Zur Auswertung der zwei aminosauretyp-spezifischen 2D-Spektren konnen 
zwei hierfur geeignete Unter-Suchmasken vorgesehen sein, und zur Auswertung der zwei 
Tripelresonanzexperimente konnen zwei weitere Unter-Suchmasken der Kreuzsignalmuster- 
Suchmaske definiert sein. Jede Unter-Suchmaske der betrachteten Kreuzsignalmuster- 
Suchmaske erzeugt ein Teilergebnis 26, 27, 28, 29. Beispielsweise enthalt ein Teilergebnis fur 
ein bestimmtes 2D-Spektrum die chemischen Verschiebungen der innerhalb der Signalsuch- 
bereiche aufgefundenen Peaks zusammen mit der Bewertungszahl fur die Unter-Suchmaske. 

Die vier Teilergebnisse 26, 27, 28, 29, die bei der Auswertung der zwei aminosauretyp- 
spezifischen 2D-Spektren sowie des Paars von Tripelresonanzexperimenten entstehen, wer- 
den der Merging-Einheit 30 zugefiihrt. Aufgabe der Merging-Einheit 30 ist es, die unter- 
schiedlichen Teilergebnisse zu einer Ergebnisliste 31 zusammenzufassen. Hierzu werden die 
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chemischen Verschiebungen in den Uberlappbereichen der einzelnen Teilergebnisse vergli- 
chen. Insbesondere auf der Grundlage der chemischen Verschiebungen der Kerne H N sowie 
N kann dann iiber ein Intervall von H N ± AH N sowie von N ± AN das Merging, also eine 
Zusammenfassung der Teilergebnisse zur Ergebnisliste 31, vorgenommen werden. Ein Ein- 
trag in der Ergebnisliste 31 umfasst einen sog. Shift-Vektor, in dem die innerhalb von zwei 
aufeinanderfolgenden Aminosauren auftretenden chemischen Verschiebungen aufgelistet 
sind, sowie die insgesamt fur das Vorliegen der Zweiergruppe von Aminosauren ermittelte 
Bewertungszahl. 

Im AnschluB wird die so entstandene Ergebnisliste gewichtet Der Wichtungsvorgang wird 
von der Cleaning-Einheit 32 vorgenommen. Die Cleaning-Einheit 32 uberpriift die Plausibili- 
tat des gefundenen Ergebnisses, indem sie mit einer Wichtungsfunktion die Shift-Vektoren 
auf ihre Richtigkeit uberpriift. 

Im folgenden ist die Ergebnisliste einer Kreuzsignalmuster-Suchmaske aufgefuhrt, welche 
nach den von dem Aminosaurepaar N-S hervorgerufenen Kreuzsignalmuster sucht. Wie auf- 
grund der durch das Programm „selma" durchgefuhrten Fragmentierung der Primarsequenz 
nicht anders zu erwarten, wurde lediglich ein Eintrag gefunden, da die Zweiergruppe von 
aufeinanderfolgenden Aminosauren N-S in der Primarsequenz des betrachteten Proteins 
OPR nur einmal vorkommt. Der Eintrag in die Ergebnisliste enthalt eine Auflistung von 
chemischen Verschiebungen sowie eine Bewertungszahl, die unter der Rubrik „Resp" aufge- 
fuhrt ist. 

( Appendix 3 ) 

Zur Uberpriifung der Plausibilitat des fur das Aminosaurepaar N-S aufgefundenen Ergebnis- 
ses wird auBerdem eine Mustersuche in den fur die komplette Proteinhauptkette aufgezeich- 
neten 3D-Experimenten durchgefuhrt. Hierbei erhalt man eine umfangreichere Ergebnisliste, 
deren Eintrage wiederum eine Anzahl von chemischen Verschiebungen sowie eine Bewer- 
tungszahl umfassen: 



( Appendix 4 ) 
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Anhand der ubereinstimmenden chemischen Verschiebungen kann erkannt werden, dass es 
sich bei dem Eintrag #53 urn den Eintrag fur das Aminosaurepaar N-S handelt Dies bestatigt 
die Konsistenz der bei den beiden Mustersuchen aufgefundenen Ergebnisse. 

Nachdem fur die einzelnen in der Proteinsequenz enthaltenen Aminosaurepaare Teilzuord- 
nungen vorgenommen worden sind, miissen diese Teilzuordnungen auf die Primarsequenz 
abgebildet werden. Dieser Schritt wird als Sequenz-Mapping 33 bezeichnet. Auf der Grundla- 
ge der Primarsequenz werden die Aminosaurepaare in den Ergebnislisten gesucht und mit der 
hochsten Wichtung beginnend auf die Sequenz abgebildet. Nach jeder Iteration wird die Ver- 
kettung der einzelnen Paare uberpriift und es werden so Fragmente von 2, 3, 4 etc. Amino- 
sauren gebildet. Nach AbschluB der Iterationsroutine werden die fehlenden Fragmente in den 
Ergebnislisten der Mustersuche fur die 3D-Experimentepaare gesucht und auf die Sequenz 
abgebildet. Nach AbschluB der Hauptkettensuche erfolgt eine gezielte Suche in den Ergebnis- 
listen aller Seitenkettenexperimente. 

Als Ergebnis des Sequenz-Mappings 33 erhalt man eine vollstandige sequenzielle Zuordnung 
34 der in den verschiedenen Spektren auftretenden Signalpeaks zu den verschiedenen Amino- 
sauren der Sequenz. Damit ist die Aufgabe, eine moglichst automatisierbare Zuordnung der 
Spektralpeaks durchzufiihren, ausgefiihrt. 

Diese Zuordnung sowie die fur die verschiedenen magnetisch aktiven Kerne des Proteins 
aufgefundenen chemischen Verschiebungen konnen als Ausgangspunkt fur die automatische 
Zuordnung von NOESY-Spektren 36 herangezogen werden. Diese Zuordnung der NOESY- 
Spektren 36 zu den verschiedenen magnetisch aktiven Kernen des Proteins wird durch das 
Programm ARIA 35 durchgefiihrt. Die Bezeichnung ARIA steht fur ^Ambiguous Restraints 
for Iterative Assignment". Der Startpunkt fur ARIA ist eine nahezu vollstandige Zuordnung 
der protonenchemischen Verschiebungen, welche zusammen mit einer Liste der Amplituden 
der NOE-Kreuzsignale und ihrer Frequenzkoordinaten einem Strukturberechnungs- 
Programm (im speziellen Fall ^Explor 4 *) iibergeben wird. Die zentrale Aufgabe des Pro- 
gramms ARIA 35 ist die Zuordnung der NOE wahrend der Strukturrechnung durch die An- 
nahme einer mehrfachen Bedeutung der einzelnen Kreuzsignale und die Anwendung einer 
iterativen Zuordnungs strategic fur dieselben. 
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Patentanspriiche 



1. Analysesystem zur automatisierten Analyse eines Satzes von NMR-Spektren, welcher fur 
5 eine n Aminosauren umfassende Polypeptidkette aufgezeichnet wurde, mit 

einer Bibliothek von Kreuzsignalmuster-Suchmasken, wobei eine Kreuzsignalmuster- 
Suchmaske zur spezifischen Erfassung der NMR-Signale eines Fragments der untersuchten 
Polypeptidkette vorgesehen ist, 

Mitteln zur Auswahl der zur Analyse benotigten Kreuzsignalmuster-Suchmasken aus der Bi- 
10 bliothek von Kreuzsignalmuster-Suchmasken entsprechend der Primarsequenz der Polypep- 
*t tidkette, welche fur jedes in der Primarsequenz enthaltene Fragment die zugehorige Kreuzsi- 
gnalmuster-Suchmaske auswahlen, 

Mitteln zur Mustererkennung, welche die verschiedenen Ergebnisse der entsprechend der 
Primarsequenz der Polypeptidkette ausgewahlten Kreuzsignalmuster-Suchmasken verbinden 
1 5 und mit dem Satz von NMR-Spektren korrelieren, 

Mitteln zur Zuordnung der NMR-Signale zu den verschiedenen Spinsystemen der Polypep- 
tidkette entsprechend dem Ergebnis der Mustererkennung. 



2. Analysesystem nach Anspruch 1, dadurch gekennzeichnet, dass 
20 die Fragmente der untersuchten Polypeptidkette jeweils zwei bzw. drei bestimmte aufeinan- 
derfolgende Aminosauren umfassen. 

^ 3. Analysesystem nach einem der vorhergehenden Anspriiche, dadurch gekennzeichnet, dass 
der Satz von NMR-Spektren sowohl NMR-Experimente zur Analyse der Hauptkettensignale 
25 als auch NMR-Experimente zur Analyse der Seitenkettensignale umfasst. 

4. Analysesystem nach einem der vorhergehenden Anspriiche, dadurch gekennzeichnet, dass 
die zur Analyse der Hauptkettensignale verwendeten NMR-Experimente 3D-Experimente, 
und insbesondere 3D-Experimenten der Typen CBCA(CO)NNH, CBCANNH, 
30 HA(CO)NNH, HANNH, HAHB(CO)NNH, HAHBNNH, HN(CA)CO, HNCO, 
HN(CO)CA, HNCA umfassen. 



5. Analysesystem nach einem der vorhergehenden Anspriiche, dadurch gekennzeichnet, dass 
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die zur Analyse der Seitenkettensignale verwendeten NMR-Experimente Experimente der 
Typen HCCH-COSY, HCCH-TOCSY, HCC(CO)NH-TOCSY umfassen. 

6. Analysesystem nach einem der vorhergehenden Anspriiche, dadurch gekennzeichnet, dass 
5 die zur Analyse der Haupt- und Seitenkettensignale verwendeten NMR-Experimente amino- 

sauretyp-spezifische 2D-Experimente umfassen, welche selektiv sind fur einen Aminosaure- 
typ oder fur eine Gruppe von Aminosauretypen. 

7. Analysesystem nach einem der vorhergehenden Anspriiche, dadurch gekennzeichnet, dass 
10 die zur Analyse der Haupt- und Seitenkettensignale erforderlichen aminosauretyp- 

/ ^ spezifischen 2D-Experimente entsprechend der Primarsequenz der Polypeptidkette festgelegt 
mp;* werden. 

8. Analysesystem nach einem der vorhergehenden Anspriiche, dadurch gekennzeichnet, dass 
15 die zur Analyse der Haupt- und Seitenkettensignale verwendeten NMR-Experimente eine 

Kombination von 2D- und 3D-Experimenten umfassen. 

9. Analysesystem nach einem der vorhergehenden Anspriiche, dadurch gekennzeichnet, dass 
ausgehend von der Zuordnung der NMR-Signale zu den verschiedenen Spinsystemen der 

20 Polypeptidkette eine Auswertung der NMR-Spektren zur Ermittlung von chemischen Ver- 
schiebungen und Kopplungskonstanten erfolgt. 

'■ / ^P S , 10. Analysesystem nach einem der vorhergehenden Anspriiche, dadurch gekennzeichnet, dass 
ausgehend von der Zuordnung der NMR-Signale zu den verschiedenen Spinsystemen der 
25 Polypeptidkette die chemischen Verschiebungen zusammengefasst und auf ihre Richtdgkeit 
uberpriift werden. 

11. Analysesystem nach einem der vorhergehenden Anspriiche, dadurch gekennzeichnet, dass 
der Satz von NMR-Spektren Spektren des Typs NOESY umfasst, deren Auswertung insbe- 

30 sondere Informationen uber die Abstande der verschiedenen Kerne der Polypeptidkette von- 
einander liefert. 

12. Analysesystem nach Anspruch 11, dadurch gekennzeichnet, dass 
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die Zuordnung der NMR-Spektren des Typs NOESY zu den verschiedenen Kernen der Po- 
lypeptidkette anhand der fur die Kerne ermittelten chemischen Verschiebungen erfolgt. 

13. Analysesystem nach einem der vorhergehenden Anspriiche, dadurch gekennzeichnet, dass 
5 die bei der Auswertung der NMR-Spektren erhaltenen GroBen als EingangsgroBen fur Struk- 

turberechnungs-Programme dienen. 

14. Analysesystem nach einem der vorhergehenden Anspriiche, dadurch gekennzeichnet, dass 
die Kxeuzsignalmuster-Suchmasken jeweils eine Anzahl von vordefinierten Signalsuchberei- 

10 chen umfassen, wobei durch das Auftreten von NMR-Signalen innerhalb der Bereichsgrenzen 
-a eines Signalsuchbereichs die Wahrscheinlichkeit erhoht wird, dass das durch die Kreuzsi- 
- ' gnalmuster-Suchmaske definierte Signalmuster vorliegt 

15. Analysesystem nach einem der vorhergehenden Anspriiche, dadurch gekennzeichnet, dass 
1 5 die Kreuzsignalmuster-Suchmasken jeweils eine Anzahl von vordefinierten Leerbereichen 

umfassen, wobei durch das Fehlen von NMR-Signalen innerhalb der Bereichsgrenzen eines 
Leerbereichs die Wahrscheinlichkeit erhoht wird, dass das durch die Kreuzsignalmuster- 
Suchmaske definierte Signalmuster vorliegt. 

20 16. Analysesystem nach einem der vorhergehenden Anspriiche, dadurch gekennzeichnet, dass 
ausgehend von der erwarteten Anzahl der NMR-Signale in den Spektren durch Iteration die 
Schwellwerte und Suchbereiche fiir die Kreuzsignalmuster-Suchmasken ermittelt werden. 

%. 

17. Analysesystem nach einem der vorhergehenden Anspriiche, dadurch gekennzeichnet, dass 
25 eine Kreuzsignalmuster-Suchmaske eine Vielzahl von Unter-Suchmasken zur Analyse der 

verschiedenen NMR-Spektren des aufgezeichneten Satzes von NMR-Spektren umfassen 
kann. 

18. Verfahren zur automatisierten Analyse eines Satzes von NMR-Spektren, welcher fur eine 
30 n Aminosauren umfassende Polypeptidkette aufgezeichnet wurde, gekennzeichnet durch fol- 

gende Schritte: 

a) Auswahlen der zur Analyse benotigten Kreuzsignalmuster-Suchmasken aus einer Biblio- 
thek von Kreuzsignalmuster-Suchmasken, wobei eine Kreuzsignalmuster-Suchmaske zur spe- 
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zifischen Erfassung der NMR-Signale eines Fragments der untersuchten Polypeptidkette vor- 
gesehen ist, und wobei das Auswahlen der bendtigten Kjreuzsignalmuster-Suchmasken ent- 
sprechend den in der Primarsequenz enthaltenen Fragmenten erfolgt; 

b) Durchfuhren einer Mustererkennung durch Korrelieren der verschiedenen ausgewahlten 
5 Kreuzsignalmuster-Suchmasken mit dem Satz von NMR-Spektren; 

c) Zuordnen der NMR-Signale zu den verschiedenen Spinsystemen der Polypeptidkette ent- 
sprechend dem Ergebnis der in Schritt b) durchgefuhrten Mustererkennung. 



19. Verfahren nach Anspruch 18, dadurch gekennzeichnet, dass 
10 die Fragmente der untersuchten Polypeptidkette jeweils zwei bzw. drei bestimmte aufeinan- 
derfolgende Aminosauren umfassen. 



20. Verfahren nach Anspruch 18 oder Anspruch 19, dadurch gekennzeichnet, dass 
der Satz von NMR-Spektren sowohl NMR-Experimente zur Analyse der Hauptkettensignale 
15 als auch NMR-Experimente zur Analyse der Seitenkettensignale umfasst. 



21. Verfahren nach einem der Anspriiche 18 bis 20, dadurch gekennzeichnet, dass 
die zur Analyse der Hauptkettensignale verwendeten NMR-Experimente 3D-Experimente, 
und insbesondere 3D-Experimenten der Typen CBCA(CO)NNH, CBCANNH, 
20 HA(CO)NNH, HANNH, HAHB (CO)NNH, HAHBNNH, HN(CA)CO, HNCO, 
HN(CO)CA, HNCA umfassen. 



22. Verfahren nach einem der Anspriiche 18 bis 21, dadurch gekennzeichnet, dass 

die zur Analyse der Seitenkettensignale verwendeten NMR-Experimente Experimente der 
25 Typen HCCH-COSY, HCCH-TOCSY, HCC(CO)NH-TOCSY umfassen. 

23. Verfahren nach einem der Anspriiche 18 bis 22, dadurch gekennzeichnet, dass 

die zur Analyse der Haupt- und Seitenkettensignale verwendeten NMR-Experimente amino- 
sauretyp-spezifische 2D-Experimente umfassen, welche selektiv sind fur einen Aminosaure- 
30 typ oder fur eine Gruppe von Aminosauretypen. 



24. Verfahren nach einem der Anspriiche 18 bis 23, dadurch gekennzeichnet, dass 
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die zur Analyse der Haupt- und Seitenkettensignale erforderlichen aminosauretyp- 
spezifischen 2D-Experimente entsprechend der Primarsequenz der Polypeptidkette festgelegt 
werden. 

25. Verfahren nach einem der Anspriiche 18 bis 24, dadurch gekennzeichnet, dass 
zur Analyse der Haupt- und Seitenkettensignale eine Kombination von 2D- und 3D- 
Experimenten verwendet wird. 

26. Verfahren nach einem der Anspriiche 18 bis 25, dadurch gekennzeichnet, dass 
ausgehend von der Zuordnung der NMR-Signale zu den verschiedenen Spinsystemen der 
Polypeptidkette eine Auswertung der NMR-Spektren zur Ermitdung von chemischen Ver- 
schiebungen und Kopplungskonstanten durchgefuhrt wird. 

27. Verfahren nach einem der Anspriiche 18 bis 26, dadurch gekennzeichnet, dass 
ausgehend von der Zuordnung der NMR-Signale zu den verschiedenen Spinsystemen der 
Polypeptidkette die chemischen Verschiebungen zusammengefasst und auf ihre Richtigkeit 
uberpriift werden. 

28. Verfahren nach einem der Anspriiche 18 bis 27, dadurch gekennzeichnet, dass 

der Satz von NMR-Spektren Spektren des Typs NOESY umfasst, und dass die Zuordnung 
der NMR-Spektren des Typs NOESY zu den verschiedenen Kernen der Polypeptidkette aus- 
gehend von den fur die verschiedenen Keme ermittelten chemischen Verschiebungen durch- 
gefiihrt wird. 

29. Verfahren nach einem der Anspriiche 18 bis 28, dadurch gekennzeichnet, dass 

die bei der Auswertung der NMR-Spektren erhaltenen GroBen als Eingangsgrofien fiir Struk- 
turberechnungs-Programme verwendet werden. 
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Zusammenfassung 

Vorrichtung und Verfahrea zu Zuordnung der NMR-Signale von Polypeptiden 

Die NMR-Spektroskopie wird zunehmend fur die Bestimmung der Struktur von Proteinen 
eingesetzt. ErfindungsgemaB werden zur gemeinsamen Auswertung der 3D- 
Tripelresonanzexperimente sowie der aminosauretyp-spezifischen 2D-Spektren Kreuzsignal- 
muster-Suchmasken verwendet. Mithilfe der erfindungsgemaBen Kreuzsignalmuster- 
Suchmasken lassen sich mittek Mustererkennung samtliche von einer oder einer Gruppe von 
Aminosauren, deren genaue Abfolge vorher aus der Proteinsequenz abgeleitet wurde und die 
Grundlage fiir die spezifische Mustererkennung bietet, verursachten Signalpeaks gemeinsam 
erfassen und auswerten. Die Erfindung ermoglicht eine vollautomatische Zuordnung der in 
den verschiedenen Spektten vorkommenden Signalpeaks zu den magnetisch aktiven Kernen 
des Proteins. 
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Fig. 5A 



4 



31 








r 


33 


> 


e 



4 





Fij. SB 



